没有工具变量、断点和随机冲击,也可以推断归因
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@sina.cn
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
哥伦比亚大学姜纬教授作演讲
来自哥伦比亚大学的姜纬教授带来了一场精彩的讲座--“Accomplishing Meaningful Inferences without Instruments, Discontinuity, and Random Shocks”(在不借助工具变量、断点回归和随机冲击的前提下如何完成有意义的推断)。
首先,姜纬老师先从红酒和健康的例子出发,引出本场报告的主题。她提到简单回归发现,每天喝红酒的人身体更健康一些,从这个事实中我们可以得出什么结论?能否得出因为喝红酒所以身体更健康的结论?有人回答,不能。姜教授追问:从这个回归中,我们能够得到什么结论呢?观众积极响应:有人说有可能是因为健康的人喜欢喝红酒。
“很好,”姜纬老师说,“这是一个反向的因果推断。”姜老师进一步解释:从回归结果中,我们仅仅知道喝红酒和健康状况存在显著的相关性,但是回归本身不能告诉我们两者之间是否存在因果关系。而建立因果关系是科研的重要意义所在。那么我们应该怎么做呢?通常应该借助工具变量,借助断点回归或者寻找随机冲击,来解决其中的内生问题。但是如果找不到这些工具,我们能不能完成一些有意义的学术研究呢?姜老师的讲座从六个方面阐述了如何不借助这些手段和技巧来进行一流的实证研究。
(一)处理效应并不是唯一有趣的经济学问题
平均处理效应(average treatment effect, ATE)是当前经济/金融研究中最受推崇的推断方法。但由于条件苛刻,在大多数情况下并不能实现,使得ATE并不能发挥作用。但是我们可以通过选择效应(selection effect)来帮助我们达成目的。
例如在Jiang, Nelson, and Vytlacil (2014, RFS)的研究中,使用某个主要的全国性的住房抵押贷款银行的数据,研究了证券化与贷款业绩表现之间的关系。以往的研究发现筛选努力与事前的贷款销售概率之间存在负相关性。与此不同,这篇论文发现从事后而言,银行资产负债表上留存的贷款比出售的贷款有更高的不良比率。这似乎和我们的直觉相反。为什么会得到这样的结果呢?这篇论文明确区分贷款业绩与贷款出售之间的事前事后关系。事前关系是银行在决定是否发起贷款时所认为的关系,事后关系适用于贷款发起和出售期间的关系。事前事后产生了相反的结论,主要是因为投资者存在选择效应,只有质量好的贷款才能在二级市场出售,因而导致了如此关系。
另一个例子是来自Mulligan and Rubinstein(2008, QJE)的关于“女性相对工资”研究,该项研究发现,1970年到1990年,性别间的平等程度变化线(用女性工资中位数除以男性工资中位数来表示)与性别内的不平等程度变化线(用90分位的男性工资除以10分位的男性工资表示)趋势是一致的。为什么会产生这种现象呢,这是因为选择效应的存在,当女性逐步进入劳动力市场时,只有聪明的女性在与男性的竞争中能够在劳动力市场上留下来,数据不能观测到未参与工作的女性,因而导致了这个现象的存在。
(二) 配对固定效应
什么是固定效应,固定效应有什么好处呢?在大多数面板数据中,固定效应都可以吸收大部分随时间不变的内生性,但并不能处理随时间变化的内生性。固定效应在处理内生性匹配层面表现除了相当强大的力量,但是需要提前分类数据。在Jiang, Wan, and Zhao(2016, RFS)的研究中,当董事会组成和会议议程都是内生的时候,可以对董事会的分歧做出解释吗?除非个体的投票数据是可以采用的,然后内生性匹配就可以通过固定效应被吸收掉。
多维的固定效应可以作为控制变量完备集合的替代。有的研究甚至只有一个回归元,例如Fisman, Paravisini, and Vig (2017, AER),文章的表四只包含了一个“Same Group”回归元,通过使用的是来自印度银行的办公人员和借款人的宗教、种族的二元匹配数据,借此来表明,贷款人和借款人之间的文化接近度(共同的守则、信仰和种族等)增加了信贷的数量,并减少了还款违约。
如果不平衡集群的原因和内生性有关,那么固定效应可能会失效,这时候可以通过寻找一个共同的比较对象来解决。比如说,现在要选择一个学生,有两个对象可供选择,都是财大的,一个来自经济学院,GPA为3.6;另一个是金融学院,GPA为3.7,给定这些信息我应该怎么选,有同学愿意回答一下吗?似乎没法选,因为两个同学来自不同的群体,GPA的直接比较不再具有参考性。但假设两个同学之间有一个可以共同比较的同学,是不是这两个同学就建立了间接的关系?在Brav, Jiang, Li (2017; early stage)关于投票代理权角逐中对冲基金与机构投资者的关系研究中就作出了这样的处理。研究发现,基金并不会在所有的代理权争夺事件中投出自己的一票;Pro-Activist衡量方法在不同事件中没有可比性;任何两只基金都可以在他们参与投票的代理权争夺事件的基础上进行比较;基金的相对排名可以通过两两比较的方法进行分类。
(三) 从预先确定的敞口中进行识别
在法律或政策变化方面的双重差分(DID)分析很常见,然而法律或政策变化几乎不是随机的。预先确定的政策敞口变化可能是一个挽救办法。
一方面可以借助与政策变化合规程度(Distance to compliance)层面来探讨。在Chhaochharia and Grinstein (2007, JF)的研究中探讨了2001年至2002年的公司丑闻导致了“萨班斯法案”的影响。丑闻发生后,美国证券交易所对于规定进行了多处修改。研究发现这些规定的宣告对公司价值有重大影响。与更符合规定的公司相比,较不符合规定条款的公司能够获得正的超额收益。同样在Ahern and Dittmar (2012, QJE)关于董事会多样化的研究中提到,2003年一项新法律规定要求挪威公司董事中40%必须是女性--当时公司内只有大约9%的董事是女性。通过使用女性董事会代表的变化作为配额之后公司董事会变化的工具变量,研究发现,法律公布后,女性董事配额所引起的约束导致了公司股价大幅下滑,并且随后几年内托宾Q也大幅下滑,符合企业选择董事会实现价值最大化的理念。因为配额导致董事会平均年龄变小,经验更不足,杠杆和收购增加,经营业绩恶化。
另一方面可以借助交错周期(Pre-staggered cycles)层面来探讨。在Fos, Li, and Tsoutsoura (2017, RFS forthcoming)的研究中,通过借助选举年份变化,探讨了董事长选举与CEO周转率敏感性之间的关系,当董事会越接近下一次选举时,CEO周转率-表现-敏感度越高。在Shue and Townsend (2017, JF)的研究中探讨了股票期权如何影响CEO的风险承担,为了克服期权授予的内生性,通过利用多年度补偿计划的制度特征,在新的实值期权的大幅增加的时间点上产生了两种截然不同的变化类型。 研究发现,给定样本期间的平均授予水平,授予的新期权增加10%将导致股票波动幅度增长2.8-4.2%。
当然,也可以通过一些事前敞口(Ex ante exposure)来探讨。这里的例子在中国很不适用,中国的父母需要负担自己孩子上学甚至以后买房子的开销,而大部分美国父母不会如此,因此许多学生上学会负担债务。在Fos, Liberman, and Yannelis (2017)的研究中,当学校学费增加的时候,低年级的学生比高年级学生未来的研究生入学率会降低,因为他们承担了更多的债务。在Lucca, Nadauld, Shen (2017, RFS R&R)的研究中,当学生通过贷款资助他们的教育时,贷款和学费的变化是相互关联的。较高的学费成本提高了学生的贷款需求,但是同时贷款供给也会影响到学费,例如通过放宽学生的资金限制,因而产生了内生性,为了克服这个联立方程问题,通过建立规则的敞口来识别贷款供给对学费变化的影响。
(四) 反驳可能存在的其他假说
在Brav, Jiang, and Kim (2015, RFS)的研究中,用企业层面的数据来描述对冲基金主动干预的实际影响,研究发现共同基金干预企业三年后,企业的生产效率明显改善,但是应该怎么处理对冲基金主动干预的内生性呢?姜老师和她的合作者们并没有直接证明,而是通过驳斥各个可能的替代假设(包括管理层自愿改革假说,行业冲击假说和对冲基金股票选择假说)来证明他们自己提出的假设的正确性。姜老师提到,这篇文章在提交杂志审稿前,已经在40个会议上被宣讲和讨论,听众提出的问题使得他们的论文能够不断提高和优化。
(五)随机时间
大多数时间发生并不是随机的,但是发生的确切时间点是有时是随机的。这类似于停止时间模型,倾向不是随机的,但是确切的时间是随机的。如果结果取决于实际的行动,那么随机时间起作用;如果结果是取决于隐藏的行动,则随机时间不起作用。
例如,在医学研究中,最重要被治疗但是现阶段未被治疗的个体可以作为现阶段被治疗个体的对照。在Brav, Jiang, Ma, and Tian (2017, JFE R&R)的研究中提到,专利从申请到批准的周期中位数为2.5年,方差为为1.5年。专利被授权的确切时间并不在activist掌控之下,activist也并不拥有专利授权确切日期的超前信息,因而专利被授权的日期就是随机的时间。因而,对于activist所瞄准的在[t-48,t-1]个月期间提交的专利与在[t-6,t + 6]个月内被批准的专利可能是在非常类似的情况下产生。
(六)进入“因果关系”黑匣子
通常来讲,我们不能断定“X导致Y”因为我们仅仅观察到了X与Y,并没有观察到二者之间的作用过程。目前,已经有很多研究开始走入黑匣子内部来揭示影响机制。例如Schwartz-Ziv and Weisbach (2013, JFE)通过研究董事会的会议记录来评估了董事会的工作模式,管理模式还是监督模式,通过分析董事会会议花在“管理”和“监督”议程上的讨论时间来作出推断,以此揭示了董事会工作模式的黑匣子。同样在Jiang, Li, Mei (2017, JF R&R)关于基金活动家套利是否导致交易失败的研究中,通过分析可能导致交易失败的各种原因挨个筛选,最后揭示出真正的影响机制,而不是借助工具变量来解决内生性。
姜纬老师的报告深入浅出,通过生活相关的案例来说明理论问题,又通过实际的研究实例来讲解遇到具体问题的解决办法,使得每种方法的讲解更为生动有趣。
注:此文来源于@上海财经大学金融学院。
推荐阅读:
2.1998-2016年中国地级市年均PM2.5数据release
4.2005-2015中国分省分行业CO2数据circulation
5.实证研究中用到的135篇文章, 社科学者常用toolkit
可以到计量经济圈社群进一步访问交流各种学术问题,这年头,我们不能强调一个人的英雄主义,需要多多汲取他人的经验教训来让自己少走弯路。
计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈绝对六多精神:社科资料最多、社科数据最多、科研牛人最多、海外名校最多、热情互助最多、前沿趋势最多。如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅社群“群公告”,不然接收不了群息,也不知道怎么进入咱们独一无二的微信群和QQ群。在规则框架下社群交流讨论无时间限制。